socket接口是实际上是操作系统提供的系统调用。socket的使用并不局限于Python语言,你可以用C或者JAVA来写出同样的socket服务器,而所有语言使用socket的方式都类似(Apache就是使用C实现的服务器)。而你不能跨语言的使用框架。框架的好处在于帮你处理了一些细节,从而实现快速开发,但同时受到Python本身性能的限制。我们已经看到,许多成功的网站都是利用动态语言(比如Python, Ruby或者PHP,比如twitter和facebook)快速开发,在网站成功之后,将代码转换成诸如C和JAVA这样一些效率比较高的语言,从而让服务器能更有效率的面对每天亿万次的请求。在这样一些时间,底层的重要性,就远远超过了框架。
TCP socket
在Python中,我们使用标准库中的socket包来进行底层的socket编程。
服务端:
|
客户端:
|
基于TCP socket的http服务器
上面的例子中,我们已经可以使用TCP socket来为两台远程计算机建立连接。然而,socket传输自由度太高,从而带来很多安全和兼容的问题。我们往往利用一些应用层的协议(比如HTTP协议)来规定socket 使用规则,以及所传输信息的格式。
HTTP协议利用请求-回应(request-response)的方式来使用TCP socket。客户端向服务器发一段文本作为request,服务器端在接收到request之后,向客户端发送一段文本作为response。在完成了这样一次request-response交易之后,TCP socket被废弃。下次的request将建立新的socket。request和response本质上说是两个文本,只是HTTP协议对这两个文本都有一定的格式要求。
|
response
整个response分为起始行(start line), 头信息(head)和主体(body)三部分。
- 起始行就是第一行:
HTTP/1.x 200 OK
HTTP/1.x表示所使用的HTTP版本,200表示状态(status code),200是HTTP协议规定的,表示服务器正常接收并处理请求,OK是供人来阅读的status code。
- 头信息
Content-Type: text/html
用来表示主题信息的类型为html文本。头信息和主体要有一行空行.
而pic_content的头信息(Content-Type: image/jpg)说明主体的类型为jpg图片(image/jpg)。
request
尽管request也可以像response那样分为三部分,request的格式与response的格式并不相同。request由客户发送给服务器,比如下面是一个request:
|
起始行可以分为三部分:
- 第一部分为请求方法(request method),第二部分是URL,第三部分为HTTP版本。request method可以有GET, PUT, POST, DELETE, HEAD。
- 第二部分为URL,它通常指向一个资源(服务器上的资源或者其它地方的资源)。像现在这样,就是指向当前服务器的当前目录的test.jpg。
浏览器访问:
从终端,我们可以看到,浏览器实际上发出了两个请求。第一个请求为 (关键信息在起始行,这一个请求的主体为空)
我们的Python程序根据这个请求,发送给服务器text_content的内容。
浏览器接收到text_content之后,知道需要获得text.jpg文件来补充为图片,立即发出了第二个请求.
我们的Python程序分析过起始行之后,发现/test.jpg符合if条件,所以将pic_content发送给客户。
最后,浏览器根据html语言的语法,将html文本和图画以适当的方式显示出来。